倾向得分匹配PSM, 你真的用对了吗? 对主流期刊86篇文章分析与总结!
凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
关于PSM及matching方法,可以参看:1. PSM倾向匹配Stata操作详细步骤和代码,干货十足,2.处理效应模型选择标准,NNM和PSM,赠书活动,3.PSM和马氏匹配已淘汰, '遗传匹配'成因果推断匹配之王,4.PSM, RDD, Heckman, Panel模型的操作程序, selective文章精华系列,5.广义PSM,连续政策变量因果识别的不二利器,6.PSM-DID, DID, RDD, Stata程序百科全书式的宝典,7.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References,8.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例,9.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,10.执行PSM的标准操作步骤, 不要再被误导了,11.PSM匹配后如何保留配对样本? 1:1, 1:4或更多情况呢?12.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!13.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文!14.内生性问题和倾向得分匹配, 献给准自然试验的厚礼,15.粗化精确匹配CEM文献推荐, 程序步骤可复制,16.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,17.匹配方法(matching)操作指南, 值得收藏的16篇文章,18.中国工业企业数据库匹配160大步骤的完整程序和相应数据,19.Match匹配估计做敏感性检验的最新方法, 让不可观测变量基础上的选择无处遁形,20.无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同,21.因果推断中的匹配方法:最全回顾和前景展望,22.内生性问题和倾向得分匹配, 献给准自然试验的厚礼,23.倾向值匹配与因果推论,史上最全面精妙的锦囊,24.匹配还是不匹配?这真是个值得考虑的问题,25.匹配比OLS究竟好在哪里?这是一个问题,26.倾向匹配分析深度(Propsensity matching analysis)
关于下方文字内容,作者:吴振香,西交利物浦大学经济与金融,通信邮箱:Zhenxiang.wu19@student.xjtlu.edu.cn
注:在读完这篇文章后,可以前往文后PDF进行更细致研读。
Propensity score matching (PSM) has become a popular technique for estimating average treatment effects (ATEs) in accounting research. In this study, we discuss the usefulness and limitations of PSM relative to more traditional multiple regression (MR) analysis. We discuss several PSM design choices and review the use of PSM in 86 articles in leading accounting journals from 2008–2014. We document a significant increase in the use of PSM from zero studies in 2008 to 26 studies in 2014. However, studies often oversell the capabilities of PSM, fail to disclose important design choices, and/or implement PSM in a theoretically inconsistent manner. We then empirically illustrate complications associated with PSM in three accounting research settings. We first demonstrate that when the treatment is not binary, PSM tends to confine analyses to a subsample of observations where the effect size is likely to be smallest. We also show that seemingly innocuous design choices greatly influence sample composition and estimates of the ATE. We conclude with suggestions for future research considering the use of matching methods.
1 介绍
2 倾向得分匹配的背景
2.1 内生性,FFM和倾向得分匹配
2.2 会计研究中的倾向分数匹配——误解与局限
2.3 PSM中重要的设计选择
确定实验组和对照组:通过匹配,观测对象要被分配到实验组和对照组中。一些实验组的构成是二元的,例如是否为国际财务报告准则,但另一些实验组是由连续变量构成的,如事务所规模,分析师数量,高管薪酬等在进行分配时需要粗化。因此,必须选择分界点来区分实验组。在这类情况下,匹配将倾向于发生在最接近分配的分界点的那些观测对象,处理组的方差会被降低,从而减弱了检验的能力增加了犯第二类错误的可能。
预测模型的说明--与MR相似,研究者们应该识别与结果和处理有关的混淆因素(X)。PSM在估计倾向得分时,通过在模型中添加X来控制混淆因素。由于估计的得分取决于模型中包含的变量X,变量的选择将会影响的样本的构成,并且很有可能也会影响到统计推断。因此,X的选择需要相关的理论来支撑。PSM匹配模型不应该基于拟合或预测能力来指定而是基于平衡处理组之间潜在的混淆或不正确的协变量。通常,PSM和MR模型之间的变量选择应该是类似的,如果理论不支持某一个变量应该被放入MR模型中,那么这个理论应该同样的不允许PSM模型加入该变量。
2.4 形成匹配样本的主要设计选择
重复和不重复的匹配
匹配半径——施加一个合适的匹配半径通常能够降低“差”匹配的可能性并且改善协变量平衡。
“一对一”和“一对多”匹配
2.5对匹配样本进行评估
对匹配质量的评估——由于PSM是所有变量的综合度量,这将会减少协变量的差异。但PSM并不能总是产生完美的反事实匹配,特别是对于连续变量。因此,研究人员应该通过确定协变量的残差差异是否足够显著,来测试匹配质量。对“协变量平衡”的检验一般使用组间均值或中位数差异。然而,即使差异“在统计上不显著”,也不能确定模型不存在FFM问题。同时,协变量差异,即使在统计上显著,也可能比未匹配的样本中小得多,从而显著减少了FFM的偏差。如果PSM不能实现协变量平衡,就没有明确的解决方案。但在评估匹配的有效性时,需要考虑协变量差异大小和潜在影响。
2.6 估计处理效应
3.PSM在会计研究中的一个案例分析
3.1 样本选择和数据描述
3.2 研究设计
3.3 检测FFM问题
3.4 第一阶段预测模型
3.5 不可重复匹配
3.6 重复匹配
3.7 匹配变量对ATE估计的影响
4.对未来研究的建议和考虑
4.1 改进倾向得分匹配应用的建议
研究使用PSM的动机应该是为了解决FFM问题,而非消除“内生性”,“自我选择”或“存在遗漏变量”问题。
在仅从单个(或少数)PSM样本得出推论之前,对于结果应更加谨慎。PSM与MR的统计推断应该是相类似的,因此两者结合使用得到的结果会更稳健。
PSM与MR模型所包含的变量应该相同。同样地,在PSM的第二阶段,研究应该使用所有控制变量(“双重稳健”估计)估计MR的处理效应。
研究应该披露PSM的设计选择,使得估计结果具有可重复性。具体来说,应该披露(1)用来估计倾向得分的模型 (2)用来估计ATE的模型 (3)是否为重复匹配 (4)多少个对照组用本匹配一个处理组样本 (5)匹配半径以及协变量平衡性
4.2 在进行倾向得分匹配时需考虑:
参考文献:
Shipman, J. E., Swanquist, Q. T., & Whited, R. L. (2017). Propensity Score Matching in Accounting Research. The Accounting Review, 92(1), 213-244.
2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。